智能论文笔记

How to quantify fields or textures? A guide to the scattering transform

Sihao Cheng , Brice Ménard

分类：机器学习

2021-11-30

从随机字段或纹理中提取信息是科学中无处不在的任务，从探索性数据分析到分类和参数估计。从物理学到生物学，它往往通过功率谱分析来完成，这通常过于有限，或者使用需要大型训练的卷积神经网络（CNNS）并缺乏解释性。在本文中，我们倡导使用散射变换（Mallat 2012），这是一种强大的统计数据，它来自CNNS的数学思想，但不需要任何培训，并且是可解释的。我们表明它提供了一种相对紧凑的汇总统计数据，具有视觉解释，并在广泛的科学应用中携带大多数相关信息。我们向该估算者提供了非技术性介绍，我们认为它可以使数据分析有利于多种科学领域的模型和参数推断。有趣的是，了解散射变换的核心操作允许人们解读CNN的内部工作的许多关键方面。

translated by 谷歌翻译

Adapting to game trees in zero-sum imperfect information games

Côme Fiegel , Pierre Ménard , Tadashi Kozuno , Rémi Munos , Vianney Perchet , Michal Valko

分类： (统计)机器学习 | 机器学习

2022-12-23

Imperfect information games (IIG) are games in which each player only partially observes the current game state. We study how to learn $\epsilon$-optimal strategies in a zero-sum IIG through self-play with trajectory feedback. We give a problem-independent lower bound $\mathcal{O}(H(A_{\mathcal{X}}+B_{\mathcal{Y}})/\epsilon^2)$ on the required number of realizations to learn these strategies with high probability, where $H$ is the length of the game, $A_{\mathcal{X}}$ and $B_{\mathcal{Y}}$ are the total number of actions for the two players. We also propose two Follow the Regularize leader (FTRL) algorithms for this setting: Balanced-FTRL which matches this lower bound, but requires the knowledge of the information set structure beforehand to define the regularization; and Adaptive-FTRL which needs $\mathcal{O}(H^2(A_{\mathcal{X}}+B_{\mathcal{Y}})/\epsilon^2)$ plays without this requirement by progressively adapting the regularization to the observations.

translated by 谷歌翻译

SMPL-IK: Learned Morphology-Aware Inverse Kinematics for AI Driven Artistic Workflows

Vikram Voleti , Boris N. Oreshkin , Florent Bocquelet , Félix G. Harvey , Louis-Simon Ménard , Christopher Pal

分类：机器学习

2022-08-16

逆运动学（IK）系统通常相对于其输入特征很僵硬，因此需要将用户干预适应新骨架。在本文中，我们旨在创建一个适用于各种人类形态的灵活的，学到的IK求解器。我们扩展了最先进的机器学习IK求解器，以在众所周知的皮肤多人线性模型（SMPL）上运行。我们称我们的模型SMPL-IK，并表明当集成到实时3D软件中时，该扩展系统为定义新型AI-Asissist Animation Workfrows提供了机会。例如，通过允许用户在摆姿势的同时修改性别和身体形状，可以使姿势创作更加灵活。此外，当使用现有姿势估计算法链接时，SMPL-IK通过允许用户从2D图像引导3D场景来加速摆姿势，同时允许进一步编辑。最后，我们提出了一种新颖的SMPL形状反转机制（SMPL-SI），将任意类人形特征映射到SMPL空间，使艺术家能够在自定义字符上利用SMPL-IK。除了显示拟议工具的定性演示外，我们还介绍了H36M和Amass数据集上的定量SMPL-IK基准。

translated by 谷歌翻译

Tight Bounds for State Tomography with Incoherent Measurements

Sitan Chen , Brice Huang , Jerry Li , Allen Liu , Mark Sellke

分类：机器学习

2022-06-10

我们考虑了状态断层扫描的经典问题：给定未知量子状态$ \ rho \ in \ mathbb {c}^{d \ times d} $的副本，输出$ \ wideHat {\ rho} $ rho- \ wideHat {\ rho} \ | _ {\ Mathsf {tr}}} \ le \ varepsilon $。当一个允许在所有副本上纠缠的连贯测量值时，$ \ theta（d^2/\ varepsilon^2）$副本是必要且足够的[Haah等。 '17，O'Donnell-Wright '16]。不幸的是，达到此速率的协议会产生大量的量子内存开销，从而阻止了当前或近期设备上的实现。另一方面，使用不连贯的（单拷贝）测量的最著名协议使用$ o（d^3/\ varepsilon^2）$副本[Kueng-rauhut-terstiege '17]开放问题以了解此速度是否紧张。在这项工作中，我们通过证明任何使用不一致测量的协议（即使适应性地选择它们）需要$ \ omega（d^3/\ varepsilon^2）$副本，与[kueng的上限匹配[kueng -rauhut-terstiege '17]。我们通过一种新的证明技术来做到这一点，该技术在测量后直接界定后验分布的“倾斜”，这给出了我们下限的简短简短证明，我们认为这可能是独立的。

translated by 谷歌翻译

Motion Inbetweening via Deep $Δ$-Interpolator

Boris N. Oreshkin , Antonios Valkanas , Félix G. Harvey , Louis-Simon Ménard , Florent Bocquelet , Mark J. Coates

分类：机器学习

2022-01-18

我们表明，如果基于深度学习的插值器使用球形线性插值器作为基线，可以更准确，有效地求解在一组关键帧上进行人类运动的任务。我们从经验上证明了我们在实现最新性能的公开数据集上的方法的实力。我们通过证明$ \ delta $ - 优势相对于最后已知帧（也称为零速度模型）的参考，进一步概括了这些结果。这支持了一个更一般的结论，即在参考框架本地对输入帧的工作比以前的工作中主张的全球（世界）参考框架更准确，更强大。我们的代码可在https://github.com/boreshkinai/delta-interpolator上公开获取。

translated by 谷歌翻译

Indexed Minimum Empirical Divergence for Unimodal Bandits

Hassan Saber , Pierre Ménard , Odalric-Ambrym Maillard

分类：人工智能 | 机器学习 | (统计)机器学习

2021-12-02

我们考虑由一组一维系列指数分布指定的多武装强盗问题，其具有单向结构的一组一维系列分布。我们介绍了IMED-UB，通过适应本田和Takemura引入的索引最小经验分解（IMED）算法来实现IMED-UB，这是一种最佳地利用单峰结构的算法[2015]。由于我们的证明技术，我们能够提供对IMED-UB算法的简洁有限时间分析。数值实验表明，IMED-UB与最先进的算法竞争。

translated by 谷歌翻译

Adaptive Multi-Goal Exploration

Jean Tarbouriech , Omar Darwiche Domingues , Pierre Ménard , Matteo Pirotta , Michal Valko , Alessandro Lazaric

分类：机器学习

2021-11-23

我们介绍了一种普遍的策略，可实现有效的多目标勘探。它依赖于adagoal，一种基于简单约束优化问题的新的目标选择方案，其自适应地针对目标状态，这既不是太困难也不是根据代理目前的知识达到的。我们展示了Adagoal如何用于解决学习$ \ epsilon $ -optimal的目标条件的政策，以便在$ L $ S_0 $ S_0 $奖励中获得的每一个目标状态，以便在$ S_0 $中获取。免费马尔可夫决策过程。在标准的表格外壳中，我们的算法需要$ \ tilde {o}（l ^ 3 s a \ epsilon ^ { - 2}）$探索步骤，这几乎很少最佳。我们还容易在线性混合Markov决策过程中实例化Adagoal，其产生具有线性函数近似的第一目标导向的PAC保证。除了强大的理论保证之外，迈克纳队以现有方法的高级别算法结构为锚定，为目标条件的深度加固学习。

translated by 谷歌翻译

Bandits with many optimal arms

Rianne de Heide , James Cheshire , Pierre Ménard , Alexandra Carpentier

分类：机器学习 | (统计)机器学习

2021-03-23

我们考虑了一种有可能无限的武器的随机强盗问题。我们为最佳武器和$ \ delta $的比例写入$ p ^ * $，以获得最佳和次优臂之间的最小含义 - 均值差距。我们在累积遗憾设置中表征了最佳学习率，以及在问题参数$ t $（预算），$ p ^ * $和$ \ delta $的最佳臂识别环境中。为了最大限度地减少累积遗憾，我们提供了订单$ \ OMEGA（\ log（t）/（p ^ * \ delta））$的下限和UCB样式算法，其匹配上限为一个因子$ \ log（1 / \ delta）$。我们的算法需要$ p ^ * $来校准其参数，我们证明了这种知识是必要的，因为在这个设置中调整到$ p ^ * $以来，因此是不可能的。为了获得最佳武器识别，我们还提供了订单$ \ Omega（\ exp（-ct \ delta ^ 2 p ^））的较低限制，以上输出次优臂的概率，其中$ c> 0 $是一个绝对常数。我们还提供了一个消除算法，其上限匹配下限到指数中的订单$ \ log（t）$倍数，并且不需要$ p ^ * $或$ \ delta $ as参数。我们的结果直接适用于竞争$ j $ -th最佳手臂的三个相关问题，识别$ \ epsilon $良好的手臂，并找到一个平均值大于已知订单的大分的手臂。

translated by 谷歌翻译